Fechar

@PhDThesis{Carvalho:2021:NeAlPo,
               author = "Carvalho, Naiallen Carolyne Rodrigues Lima",
                title = "Bisecting stochastic clustering: a new algorithm for PolSAR image 
                         unsupervised classification",
               school = "Instituto Nacional de Pesquisas Espaciais (INPE)",
                 year = "2021",
              address = "S{\~a}o Jos{\'e} dos Campos",
                month = "2020-11-10",
             keywords = "stochastic distance, Riemann geometry, divisive hierarchical 
                         clustering, PolSAR image, unsupervised classification, distancia 
                         estocastica, geometria de Riemann, agrupamento divisivo 
                         hierarquico, imagens PolSAR, classifica{\c{c}}{\~a}o n{\~a}o 
                         supervisionada.",
             abstract = "PolSAR (Polarimetric Synthetic Aperture Radar) images can be 
                         represented by a set of complex Hermitian positive definite 
                         matrices, which have a natural Riemannian metric tensor. PolSAR 
                         images are, also, known for following the Wishart distribution, 
                         and, by using the information theory contrast function, stochastic 
                         distances between Wishart distributions can be derived. This work 
                         addresses unsupervised classification strategies, explores the 
                         Riemann geometry and studies stochastic distances applied to 
                         PolSAR images. The proposed algorithm, named Bisecting Stochastic 
                         Clustering (BSC), is a combination between the Stochastic 
                         Clustering (SC) algorithm and the hierarchical divisive clustering 
                         algorithm. The SC algorithm is technique based on K-means, which 
                         uses stochastic distances as similarity metric. The SC algorithm 
                         can, usually, be trapped in a local minimum, what led to incorrect 
                         clustering results. Therefore, the choice of good initial 
                         parameter candidates is essential for the clustering quality. The 
                         BSC algorithm is a top-down procedure, it starts with all samples 
                         in an unique cluster, that are successively splitted into two new 
                         sub-clusters. This algorithm is mainly divided into three steps: 
                         the initial parameter determination, the cluster bi-partitioning 
                         procedure, and the choice of a suitable cluster to split. In this 
                         work, two algorithms for the initial parameter determination are 
                         tested: the Expectation-Maximization (EM) algorithm for Wishart 
                         Mixture Model and the Riemann Principal Direction Divisive 
                         Partitioning (RPDDP). The RPDDP is a new proposed algorithm, whose 
                         goal is to perform the bi-partition of a dataset. This algorithm 
                         estimates the dataset covariance matrix under the the Riemann 
                         geometry, in order to find the principal component, which is used 
                         to separate the input data in two sub-clusters. From the RPDDP two 
                         estimated sub-clusters, the BSC derives the initial parameters. 
                         The BSC second step is performed by the SC algorithm. The BSC 
                         builds a dendrogram in order to represent the dataset splitting. 
                         Each sub-cluster, or node, links two successor sub-clusters in the 
                         dendrogram. When three or more nodes are available in one 
                         dendrogram level, the algorithm needs to choose a node to split. 
                         The BSC third step uses the information gain as the node choice 
                         rule. This work analyses the SC algorithm and two main variants of 
                         BSC. The first variant uses the RPDDP as initial parameter 
                         determiner, and the second, uses the EM algorithm as initial 
                         parameter determiner. The Bhattacharyya (B), Kullback-Leibler (KL) 
                         and Hellinger (H) stochastic distances are analysed in this work. 
                         In total, nine algorithms are evaluated: SC-B, SC-KL, SC-H, 
                         BSC-R-B, BSC-R-KL, BSC-R-H, BSC-EM-B, BSC-EM-KL, BSC-EM-H. The 
                         algorithms were analysed in a quantitative and qualitative way. 
                         The quantitative analysis consists in the confusion matrix and 
                         accuracy estimation, and the qualitative analysis explore the BSC 
                         dendrogram and the clusters scattering mechanism by inspecting the 
                         Plan H \− alpha. RESUMO: As imagens PolSAR (Polarimetric 
                         Synthetic Aperture Radar) podem ser representadas por um conjunto 
                         de matrizes definidas positivas Hermitianas complexas, que possuem 
                         um tensor m{\'e}trico Riemanniano. As imagens PolSAR tamb{\'e}m 
                         s{\~a}o conhecidas por seguir a distribui{\c{c}}{\~a}o de 
                         Wishart e, usando a fun{\c{c}}{\~a}o de contraste da teoria da 
                         informa{\c{c}}{\~a}o, dist{\^a}ncias estoc{\'a}sticas entre as 
                         distribui{\c{c}}{\~o}es de Wishart podem ser derivadas. Este 
                         trabalho aborda estrat{\'e}gias de classifica{\c{c}}{\~a}o 
                         n{\~a}o supervisionadas, explora a geometria de Riemann e estuda 
                         dist{\^a}ncias estoc{\'a}sticas aplicadas {\`a}s imagens 
                         PolSAR. O algoritmo proposto, denominado Bisecting Stochastic 
                         Clustering (BSC), {\'e} uma combina{\c{c}}{\~a}o entre o 
                         algoritmo Stochastic Clustering (SC) e o algoritmo 
                         hier{\'a}rquico divisivo. O algoritmo SC {\'e} uma t{\'e}cnica 
                         baseada no K-m{\'e}dias, que usa dist{\^a}ncias 
                         estoc{\'a}sticas como m{\'e}trica de similaridade. O algoritmo 
                         SC pode, geralmente, ficar preso em um m{\'{\i}}nimo local, o 
                         que leva a agrupamentos incorretos. Por isso, a escolha de bons 
                         par{\^a}metros iniciais {\'e} essencial para a qualidade do 
                         agrupamento. O algoritmo BSC {\'e} um procedimento top-down, ele 
                         come{\c{c}}a com todas as amostras em um {\'u}nico cluster, que 
                         {\'e} sucessivamente dividido em dois novos subclusters. Este 
                         algoritmo {\'e} dividido em tr{\^e}s etapas: a 
                         determina{\c{c}}{\~a}o do par{\^a}metro inicial, o procedimento 
                         de bi-particionamento do cluster e a escolha de um cluster 
                         adequado para dividir. Neste trabalho, dois algoritmos para a 
                         determina{\c{c}}{\~a}o dos par{\^a}metros iniciais s{\~a}o 
                         testados: o algoritmo Expectation-Maximization (EM) para o Modelo 
                         de Mistura de Wishart e o Particionamento Divisivo da 
                         Dire{\c{c}}{\~a}o Principal de Riemann (RPDDP). O RPDDP {\'e} 
                         um novo algoritmo, proposto com objetivo de realizar a 
                         bi-parti{\c{c}}{\~a}o de um conjunto de dados. Este algoritmo 
                         estima a matriz de covari{\^a}ncia do conjunto de dados sob a 
                         geometria de Riemann, a fim de encontrar a componente principal, 
                         que {\'e} usada para separar os dados de entrada em dois 
                         subclusters. A partir dos dois subclusters estimados pelo RPDDP, o 
                         BSC deriva os par{\^a}metros iniciais. A segunda etapa do BSC 
                         {\'e} realizada pelo algoritmo SC. O BSC constr{\'o}i um 
                         dendrograma para representar a divis{\~a}o do conjunto de dados. 
                         Cada sub-cluster, ou n{\'o}, {\'e} ligado a dois sub-grupos 
                         sucessores no dendrograma. Quando h{\'a} tr{\^e}s ou mais 
                         n{\'o}s dispon{\'{\i}}veis em um n{\'{\i}}vel de dendrograma, 
                         o algoritmo precisa escolher um n{\'o} para ser dividido. A 
                         terceira etapa do BSC usa o ganho de informa{\c{c}}{\~a}o como 
                         regra de escolha desse n{\'o}. Este trabalho analisa o algoritmo 
                         SC e as duas variantes principais do BSC. A primeira variante usa 
                         o RPDDP como determinador dos par{\^a}metros iniciais e a 
                         segunda, usa o algoritmo EM. As dist{\^a}ncias estoc{\'a}sticas 
                         de Bhattacharyya (B), Kullback-Leibler (KL) e Hellinger (H) 
                         s{\~a}o analisadas neste trabalho. No total, nove algoritmos 
                         s{\~a}o avaliados: SC-B, SC-KL, SC-H, BSC-R-B, BSC-R-KL, BSC-RH, 
                         BSC-EM-B, BSC-EM-KL, BSC-EM-H. Os algoritmos foram analisados de 
                         forma quantitativa e qualitativa. A an{\'a}lise quantitativa 
                         consiste no calculo da matriz de confus{\~a}o e na estimativa da 
                         acuracia; a an{\'a}lise qualitativa explora o dendrograma e os 
                         mecanismos de espalhamento dos clusters atrav{\'e}s da 
                         inspe{\c{c}}{\~a}o do Plan H\− alpha.",
            committee = "K{\"o}rting, Thales Sehn (presidente) and Sant'Anna, Sidnei 
                         Jo{\~a}o Siqueira (orientador) and Bins, Leonardo Sant'Anna 
                         (orientador) and Shiguemori, Elcio Hideiti and Carvalho, Solon 
                         Ven{\^a}ncio de and Correia, Antonio Henrique and Sousa 
                         J{\'u}nior, Manoel de Ara{\'u}jo",
         englishtitle = "Bi-divis{\~a}o estoc{\'a}stica de agrupamento: um novo algoritmo 
                         para classifica{\c{c}}{\~a}o n{\~a}o supervisionada de imagens 
                         polSAR",
             language = "en",
                pages = "179",
                  ibi = "8JMKD3MGP3W34R/43RU675",
                  url = "http://urlib.net/ibi/8JMKD3MGP3W34R/43RU675",
           targetfile = "publicacao.pdf",
        urlaccessdate = "28 abr. 2024"
}


Fechar